import re
#以只读方式打开文件，文件的指针将会放在文件的开头，这是默认模式
#-1表示默认缓冲策略
file = open("data/data07_04.txt","r",-1,"utf-16")
s = file.read() #读取全部内容
print("全部内容：",s)
pattern = re.compile("[A-Za-z]") #查找英文内容
en = "".join(pattern.findall(s))
print("英文内容：",en)
pattern = re.compile("[\u4e00-\u9fa5]") #查找中文内容
cn = "".join(pattern.findall(s))
print("中文内容：",cn)
print("-"*56)
file.close()
#UTF-16:使用2、4个字节表示所有字符；优先使用2个字符，否则使用4个字符
file = open("data/data07_04.txt","r",-1,"utf-16")
s = file.read(9) #读取9个字符，1中文占2字节，2英文占1个字节
print("前6个字符：",s)
s = file.read() #读取剩余内容
print("剩余内容:",s)
file.close()